智能论文笔记

3D-PL: Domain Adaptive Depth Estimation with 3D-aware Pseudo-Labeling

Yu-Ting Yen , Chia-Ni Lu , Wei-Chen Chiu , Yi-Hsuan Tsai

分类：计算机视觉

2022-09-19

对于单眼深度估计，获取真实数据的地面真相并不容易，因此通常使用监督的合成数据采用域适应方法。但是，由于缺乏实际数据的监督，这仍然可能会导致较大的域间隙。在本文中，我们通过从真实数据中生成可靠的伪基础真理来开发一个域适应框架，以提供直接的监督。具体而言，我们提出了两种用于伪标记的机制：1）通过测量图像具有相同内容但不同样式的深度预测的一致性，通过测量深度预测的一致性； 2）通过点云完成网络的3D感知伪标记，该网络学会完成3D空间中的深度值，从而在场景中提供更多的结构信息，以完善并生成更可靠的伪标签。在实验中，我们表明我们的伪标记方法改善了各种环境中的深度估计，包括在训练过程中使用立体声对。此外，该提出的方法对现实世界数据集中的几种最新无监督域的适应方法表现出色。

translated by 谷歌翻译

Once-for-All Sequence Compression for Self-Supervised Speech Models

Hsuan-Jui Chen , Yen Meng , Hung-yi Lee

分类：自然语言处理

2022-11-04

The sequence length along the time axis is often the dominant factor of the computational cost of self-supervised speech models. Works have been proposed to reduce the sequence length for lowering the computational cost. However, different downstream tasks have different tolerance of sequence compressing, so a model that produces a fixed compressing rate may not fit all tasks. In this work, we introduce a once-for-all (OFA) sequence compression framework for self-supervised speech models that supports a continuous range of compressing rates. The framework is evaluated on various tasks, showing marginal degradation compared to the fixed compressing rate variants with a smooth performance-efficiency trade-off. We further explore adaptive compressing rate learning, demonstrating the ability to select task-specific preferred frame periods without needing a grid search.

translated by 谷歌翻译

Inversion of Time-Lapse Surface Gravity Data for Detection of 3D CO$_2$ Plumes via Deep Learning

Adrian Celaya , Bertrand Denel , Yen Sun , Mauricio Araya-Polo , Antony Price

分类：机器学习

2022-09-06

我们引入了三种算法，将模拟重力数据倒入3D地下岩石/流属性。第一种算法是一种基于数据驱动的，基于深度学习的方法，第二个算法将深度学习方法与物理建模混合到单个工作流程中，第三个考虑了表面重力监测的时间依赖性。这些提出的算法的目标应用是地下CO $ _2 $李子作为监视CO $ _2 $固存部部署的补充工具的预测。每种提出的算法的表现都优于传统的反转方法，并在几乎实时实时产生高分辨率的3D地下重建。我们提出的方法以$ \ mu $ gals的形式获得了预测的羽状几何形状和接近完美数据失误的骰子得分。这些结果表明，将4D表面重力监测与深度学习技术相结合代表了一种低成本，快速和非侵入性的方法，用于监测CO $ _2 $存储站点。

translated by 谷歌翻译

Deep is a Luxury We Don't Have

Ahmed Taha , Yen Nhi Truong Vu , Brent Mombourquette , Thomas Paul Matthews , Jason Su , Sadanand Singh

分类：计算机视觉 | 机器学习

2022-08-11

医疗图像以高分辨率出现。高分辨率对于在早期发现恶性组织至关重要。然而，该决议在建模远距离依赖性方面提出了挑战。浅变压器消除了这个问题，但它们遭受了二次复杂性。在本文中，我们通过利用线性自我注意近似来解决这种复杂性。通过这种近似，我们提出了一个称为HCT的有效视觉模型，该模型代表高分辨率卷积变压器。HCT以明显降低的成本将变形金刚的优点带入了高分辨率图像。我们使用高分辨率乳房X线摄影数据集评估HCT。HCT明显优于其CNN对应物。此外，我们通过评估其有效的接收场来证明HCT对医学图像的适应性。编码可在https://bit.ly/3ykbhhf上获得。

translated by 谷歌翻译

Encoder-Decoder Architecture for 3D Seismic Inversion

Maayan Gelboim , Amir Adler , Yen Sun , Mauricio Araya-Polo

分类：机器学习

2022-07-29

颠倒地震数据以建立3D地质结构是一项艰巨的任务，这是由于大量获得的地震数据，以及由于波动方程的迭代数值解决方案而引起的最高计算负载，如行业标准的工具所要求的，例如Full WaveForm反转（FWI）。例如，在3.5公里$ \ $ 4.5公里的地面尺寸的区域中，3D模型重建需要数百个地震射击场立方体，从而导致记录数据的Terabytes。本文提出了一种深度学习解决方案，用于在地震调查中记录的田间噪声的情况下重建现实的3D模型。我们实施和分析了一个卷积编码器架构，该体系结构有效地处理了数百种地震收集立方体的整个集合。所提出的解决方案表明，在存在10dB信噪比的场噪声的情况下，可以以结构相似性指数度量（SSIM）为0.8554（在1.0中）重建现实的3D模型。

translated by 谷歌翻译

S4: a High-sparsity, High-performance AI Accelerator

Ian En-Hsu Yen , Zhibin Xiao , Dongkuan Xu

分类：机器学习

2022-07-16

利用稀疏性神经网络的稀疏性已成为减少记忆足迹，I/O成本和计算工作量的最潜在方法之一。而且，由于已经考虑了较大的模型尺寸以及预训练巨型模型的趋势，因此可以利用的稀疏度已变得更高。另一方面，与已广泛支持的选项相比，大多数计算平台中不支持通过高度稀疏性加速。在这项工作中，我们介绍了第一个支持高度稀疏加速度的商业硬件平台，最高32次-S4。结合最先进的稀疏修剪技术，我们在主流推理平台（例如NVIDIA T4）上展示了S4上的几次实用推断。我们还表明，在实践中，较大尺寸的稀疏模型比较小尺寸的密集模型可以实现更高的精度和更高的S4吞吐量。

translated by 谷歌翻译

TLETA: Deep Transfer Learning and Integrated Cellular Knowledge for Estimated Time of Arrival Prediction

Hieu Tran , Son Nguyen , I-Ling Yen , Farokh Bastani

分类：机器学习

2022-06-17

车辆到达时间预测已被广泛研究。随着物联网设备和深度学习技术的出现，估计的到达时间（ETA）已成为智能运输系统中的关键组成部分。尽管ETA存在许多工具，但由于特殊车辆的交通数据有限，ETA的特殊车辆（例如救护车，消防车等）仍然具有挑战性。现有作品使用一种模型用于所有类型的车辆，这可能会导致精确度较低。为了解决这个问题，作为该领域的第一个，我们为驾驶时间预测提出了一个深度转移学习框架TLETA。 TLETA构建了细胞时空知识网格，用于提取驾驶模式，并结合道路网络结构嵌入以构建ETA的深神经网络。 Tleta包含可转移的层，以支持不同类别的车辆之间的知识转移。重要的是，我们的转移模型仅训练最后一层以绘制转移的知识，从而大大减少了训练时间。实验研究表明，我们的模型以高精度预测旅行时间，并胜过许多最先进的方法。

translated by 谷歌翻译

SmartGD: A Self-Challenging Generative Adversarial Network for Graph Drawing

Xiaoqi Wang , Kevin Yen , Yifan Hu , Han-Wei Shen

分类：机器学习

2022-06-13

已经在图形图上进行了大量研究，但是许多现有方法仅着重于优化图形布局的特定美学方面。给定图形，生成满足某些人类美学偏好的良好布局仍然是一项具有挑战性的任务，尤其是如果无法将这种偏好表示为可区分的目标函数。在本文中，我们提出了一个基于学生教师GAN的图形绘图框架SmartGD，该框架学会了绘制图形，就像人类学习执行任务一样。 SmartGD中的学生网络通过模仿良好的布局示例来学习图形，而SmartGD的教师网络负责提供有关生成布局优点的评分。当缺乏具体的审美标准来指定构成良好布局的内容时，学生网络可以从良好的布局示例中学习。另一方面，如果可以通过定量标准评估布局的好处（即使不是可区分的），学生网络可以将其用作优化目标美学的具体目标。为了实现目标，我们提出了一种新颖的gan变体，自挑战的gan，以了解有关任何审美标准的最佳布局分布，无论标准是否可区分。所提出的图形绘图框架不仅可以以与良好的布局示例相似的样式绘制图形，而且还可以根据任何给定的美学标准优化图形布局。一旦训练了模型，就可以根据示例布局的样式或所选美学标准可视化任意图。全面的实验研究表明，根据普通商定的指标，SMARTGD优于12种基准方法。

translated by 谷歌翻译

Regression-based projection for learning Mori-Zwanzig operators

Yen Ting Lin , Yifeng Tian , Danny Perez , Daniel Livescu

分类： (统计)机器学习

2022-05-10

我们建议采用统计回归作为投影操作员，以使数据驱动以数据为基础的Mori-Zwanzig形式主义中的运营商学习。我们提出了一种原则性方法，用于为任何回归模型提取Markov和内存操作员。我们表明，线性回归的选择导致了基于Mori的投影操作员最近提出的数据驱动的学习算法，这是一种高阶近似Koopman学习方法。我们表明，更具表现力的非线性回归模型自然填补了高度理想化和计算有效的MORI投影操作符和最佳迄今为止计算上最佳的Zwanzig投影仪之间的差距。我们进行了数值实验，并提取了一系列基于回归的投影的运算符，包括线性，多项式，样条和基于神经网络的回归，随着回归模型的复杂性的增加而显示出渐进的改进。我们的命题提供了一个通用框架来提取内存依赖性校正，并且可以轻松地应用于文献中固定动力学系统的一系列数据驱动的学习方法。

translated by 谷歌翻译

Generative Adversarial Method Based On Neural Tangent Kernels

Yu-Rong Zhang , Sheng Yen Chou , Shan-Hung Wu

分类：机器学习

2022-04-08

生成对抗网络（GAN）的最新发展驱动了许多计算机视觉应用。尽管综合质量很高，但训练甘斯经常会面临几个问题，包括非缔合，模式崩溃和梯度消失。有几个解决方法，例如，正规化Lipschitz的连续性和采用Wasserstein距离。尽管这些方法可以部分解决问题，但我们认为这些问题是由于用深神经网络对歧视者建模而引起的。在本文中，我们基于新衍生的深神网络理论，称为神经切线内核（NTK），并提出了一种称为生成对抗性NTK（GA-NTK）的新生成算法。 GA-NTK将鉴别器建模为高斯过程（GP）。借助NTK理论，可以用封闭式公式来描述GA-NTK的训练动力学。为了将数据与封闭形式公式合成，可以将目标简化为单层对抗优化问题。我们在现实世界数据集上进行了广泛的实验，结果表明，GA-NTK可以生成与GAN相当的图像，但在各种条件下训练要容易得多。我们还研究了GA-NTK的当前局限性，并提出了一些解决方法，以使GA-NTK更加实用。

translated by 谷歌翻译